Mask R-CNN 是一种用于计算机视觉的深度学习模型,主要用于实例分割(在图像中检测出每个物体,并为每个物体生成像素级的“遮罩/掩膜”),同时通常也能输出目标检测的边界框与类别信息。它是在 Faster R-CNN 的基础上扩展而来。
/mæsk ɑːr siː ɛn ɛn/
Mask R-CNN can segment objects in an image.
Mask R-CNN 可以对图像中的物体进行分割。
In our project, we fine-tuned Mask R-CNN on a small dataset to detect and precisely outline different tools on a workbench.
在我们的项目中,我们在一个小数据集上对 Mask R-CNN 进行微调,以检测并精确勾勒工作台上不同工具的轮廓。
“Mask” 指模型输出的像素级掩膜(mask);“R-CNN” 来自 “Region-based Convolutional Neural Network”(基于候选区域的卷积神经网络)这一系列方法的命名传统。Mask R-CNN 由 Kaiming He 等人在 2017 年提出,核心思路是在目标检测框架上增加一个分支来预测每个实例的分割掩膜,从而实现实例分割。